其他
文本如药?如何通过多样例学习判断有效成分?如何识别辱骂文本?对话质量分析应用场景?AAIG自然语言理解实验室EMNLP专场(上)
《追AI的人》系列直播第15期——AAIG自然语言理解实验室EMNLP专场,分享了《机器=冰冷?看机器如何捕捉你的小情绪》和《文本如药,如何精确提炼“有效成分”?》。
以下为直播的文字回放,分为上下两篇,本文为上篇,共计6688字。
阿里安全智能算法小二,清华大学计算机系硕士优秀毕业生。研究方向为人机对话和模型鲁棒性方面。曾于国际会议AAAI,ACL发表论文,本次会介绍到的最新工作已被EMNLP接收。
多样例学习定义介绍
🥳
先来玩个小游戏
假如你是一位古代的神医,正在游历中华大地,途中路过了一个地方,刚好在流行一个新的疾病,当地的医生你去询问了一下,他们已经做了一些尝试,他们尝试了三种药方,分别如右边的图例所显示,第一种是人参灵芝加枸杞,结果身边人吃了没什么好转,他还是不健康的状态,后面两味药他换了其中的一些东西,病人就出现了好转。如果你听了这个医生的描述之后,你觉得哪几味药材是治疗这个病的对症的药是有效成分,以后碰到这样的疾病该怎么医治呢?
我们可以拿到一些历史对话的数据来做训练数据。但是有这么多标签,并且我们没有训练好人工智能的算法自动,这个模型之前对话的质量分析其实是由人来做的,所以它的标签可能只是对应的是整一个对话,这个就跟刚才的我们多样例学习的定义对上了,标签对应的是整一个整体。而我们有时候又想去知道它具体是哪一句话,比如说具体是哪一句话询问了原因,具体是哪一句话需要答复。
● AAIG成立一周年!砥砺前行,谱写新时代的科技之歌~请查收这份最新的自我介绍
● AI治理必修第16刊|国产AI作画神器来了!日增5万用户的背后有什么秘诀?DeepMind攻克50年数学难题!
● 听委员说|AAIG薛晖出席杭州市"两会",提出加快建立人工智能产业的多元协同治理机制
● 如何构建企业数据管理体系?AI产品出海有哪些数据风险?浅谈AI数据合规与风险防范实践(下)
● “算法偏见”是概念炒作吗?「这个AI不太冷」第3期带你揭秘现实AI!
更多人工智能治理和可持续发展好文点击下方名片关注和星标【阿里巴巴人工智能治理与可持续发展研究中心】👇AAIG课代表,获取最新动态就找她